Created: 2026-03-06 07:53:04
Updated: 2026-03-06 07:53:04

在这章中我们将找出,通信信道使用nn次后最大可分辨的信号量。这个数量随nn指数增长,指数值叫做channel capacity.
信道的物理模型如图所示。
来自有限符号表的源符号倍映射成信道符号的序列,之后经过信道的输出序列被接收方接收。输出序列是随机的,但有一个由输入序列决定的概率分布。从输出信号中,我们尝试恢复传递的信息。

定义:定义无记忆的离散“信息”通道容量为:

C=maxp(x)I(X;Y)C= \max _{p(x)} I(X;Y)

最大值取遍所有可能的输入分布p(x)p(x)

例子:
1.非重叠输出的噪声信道:

每个传输结果可以确定传输的内容,因此C=maxI(X;Y)=1bitC=\max I(X;Y)=1 bit,当p(x)=(12,12)p(x)=\left( \frac{1}{2}, \frac{1}{2} \right)时取到。

2.noisy typewriter


maxI(X;Y)=max[H(Y)H(YX)]=max(H(Y))1=log261=log13\max I(X;Y) = \max[H(Y)-H(Y|X)]=\max(H(Y))-1=\log 26-1 = \log 13

3.二元对称信道:0有1p1-p概率保持0,pp概率翻转为1,输入1同样.

I(X;Y)1H(p)I(X;Y)\leq 1-H(p)

4.二元擦除信道:0和1均有α\alpha概率消失。

C=maxp(x)I(X;Y)=maxp(x)(H(Y)H(YX))=maxp(x)H(Y)H(α)C = \max_{p(x)} I(X;Y) = \max_{p(x)} (H(Y)-H(Y|X))=\max_{p(x)} H(Y) -H(\alpha)

EE为事件{Y=e}\{Y=e\}

H(Y)=H(Y,E)=H(E)+H(YE)H(Y) = H(Y,E) = H(E)+H(Y|E)

X=1X=1概率为π\pi,于是

H(Y)=H((1π)(1α),α,π(1α))=H(α)+(1α)H(π)H(Y) = H((1-\pi)(1-\alpha),\alpha,\pi(1-\alpha))= H(\alpha)+(1-\alpha)H(\pi)

C=maxp(x)H(Y)H(α)=maxπ(1α)H(π)+H(α)H(α)=maxπ(1α)H(π)=1α\begin{align} C & =\max _{p(x)} H(Y)-H(\alpha) \\ & = \max _{\pi}(1-\alpha)H(\pi) + H(\alpha) - H(\alpha) \\ & = \max _{\pi} (1-\alpha) H(\pi) \\ & = 1-\alpha \end{align}

5.对称信道:概率转移矩阵p(yx)p(y\mid x)的每一行/列都是一组概率的排列。
例:
Y=X+Z(mod c)Y=X+Z (\text{mod}\ c)
ZZ分布在0,1,c10,1,\dots c-1之间,X与Z有相同的字母表。
此时

I(X;Y)=H(Y)H(YX)=H(Y)H(r)logYH(r)I(X;Y) = H(Y)-H(Y|X)=H(Y)-H(\mathbf{r})\leq \log|\mathscr{Y}|-H(r)

当输入均匀分布时,输出也均匀分布,此时取得等号

弱对称信道:每一行都是一组概率的排列,例:

p(yx)=(131612131216)p(y|x) = \left( \begin{matrix} \frac{1}{3} & \frac{1}{6} & \frac{1}{2} \\ \frac{1}{3} & \frac{1}{2} & \frac{1}{6} \end{matrix} \right)

上述结论同样适用于弱对称信道。

性质:

  1. C0C\geq 0
  2. ClogHC\leq \log |\mathscr{H}|
  3. ClogYC\leq \log |\mathscr{ Y}|
  4. I(X,Y)I(X,Y) is continuous and concave function of p(x)p(x)

Channel coding theorem

信道编码定理给出了信道中信息传输的最大速率RCR\leq C。一个简单解释如下:

使用nn次信道时,长度n的编码XnX^n构成了空间Xn\mathscr{X}^n,发送的序列构成了空间Yn\mathscr{Y}^n。考虑典型集的大小,Xn\mathscr{X}^n中有2nH(X)2^{nH(X)}个元素,Yn\mathscr{Y}^n中有2nH(Y)2^{nH(Y)}个元素。给定一个XnX^n,传输后对应的典型集合大小为2nH(YX)2^{nH(Y|X)}。为了防止混淆,我们应该使Yn\mathscr{Y}^n中结果不相交,因此不能传输Xn\mathscr{X}^n中所有元素。那么有多少元素可以被传输呢?作为估计,我们可以用Yn\mathscr{Y}^n的大小除以每次传输的典型集大小,即:

2n(H(Y))H(YX)=2nI(X;Y)2^{n(H(Y))-H(Y|X)}=2^{nI(X;Y)}

也就是说,有2nI(X;Y)2^{nI(X;Y)}个序列是可以互相分辨的。从而传输信息量为nI(X;Y)nI(X;Y),将这个数字平均到每次使用信道,并控制X的概率分布使其最大,于是得到结论:单次传输的平均信息量(亦即通信速率)最多为maxp(x)I(X;Y)=C\max_{p(x)}I(X;Y)=C

(Channel coding theorem) for every rate R<CR<C, there exists a sequence of (2nR,n)(2^{nR},n) codes with maximum probability of error λ(n)0\lambda^{(n)}\to0; Conversely, any sequence of (2nR,n)(2^{nR},n) codes with λ(n)0\lambda^{(n)} \to 0 must have RCR\leq C

Leave a Comment

captcha
Fontsize